AI资讯新闻榜单内容搜索- LLM

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索:  LLM
端到端优化所有能力,字节跳动提出强化学习LLM Agent框架AGILE

端到端优化所有能力,字节跳动提出强化学习LLM Agent框架AGILE

端到端优化所有能力,字节跳动提出强化学习LLM Agent框架AGILE

大语言模型(Large Language Models, LLMs)的强大能力推动了 LLM Agent 的迅速发展。围绕增强 LLM Agent 的能力,近期相关研究提出了若干关键组件或工作流。然而,如何将核心要素集成到一个统一的框架中,能够进行端到端优化,仍然是一个亟待解决的问题。

来自主题: AI资讯
6620 点击    2024-09-30 16:06
《Python机器学习》作者科普长文:从头构建类GPT文本分类器,代码开源

《Python机器学习》作者科普长文:从头构建类GPT文本分类器,代码开源

《Python机器学习》作者科普长文:从头构建类GPT文本分类器,代码开源

近日,机器学习研究员、畅销书《Python 机器学习》作者 Sebastian Raschka 又分享了一篇长文,主题为《从头开始构建一个 GPT 风格的 LLM 分类器》。

来自主题: AI资讯
3774 点击    2024-09-29 14:26
Scaling Law瓶颈,Cursor编程为什么这么强?团队参与新研究掏出秘密武器

Scaling Law瓶颈,Cursor编程为什么这么强?团队参与新研究掏出秘密武器

Scaling Law瓶颈,Cursor编程为什么这么强?团队参与新研究掏出秘密武器

近段时间,AI 编程工具 Cursor 的风头可说是一时无两,其表现卓越、性能强大。近日,Cursor 一位重要研究者参与的一篇相关论文发布了,其中提出了一种方法,可通过搜索自然语言的规划来提升 Claude 3.5 Sonnet 等 LLM 的代码生成能力。

来自主题: AI技术研报
6104 点击    2024-09-11 13:57
LLM 进化分岔口:多模态、成本、代码推理

LLM 进化分岔口:多模态、成本、代码推理

LLM 进化分岔口:多模态、成本、代码推理

头部模型的新一代模型的是市场观测、理解 LLM 走向的风向标。即将发布的 OpenAI GPT-Next 和 Anthropic Claude 3.5 Opus 无疑是 AGI 下半场最关键的事件。

来自主题: AI资讯
7171 点击    2024-09-06 11:44
Unstructured.io:让企业非结构化数据 LLM-Ready

Unstructured.io:让企业非结构化数据 LLM-Ready

Unstructured.io:让企业非结构化数据 LLM-Ready

企业要用好 LLM 离不开高质量数据。和传统机器学习模型相比,LLM 对于数据需求量更大、要求更高,尤其是非结构化数据。而传统 ETL 工具并不擅长非结构化数据的处理,因此,企业在部署 LLM 的过程中,数据科学家们往往要耗费大量的时间精力在数据处理环节。这一环节既关系到 LLM 部署的效率和质量,也对数据科学家人力的 ROI 产生影响。

来自主题: AI资讯
8828 点击    2024-09-05 10:02
LLM的范式转移:RL带来新的 Scaling Law

LLM的范式转移:RL带来新的 Scaling Law

LLM的范式转移:RL带来新的 Scaling Law

从几周前 Sam Altman 在 X 上发布草莓照片开始,整个行业都在期待 OpenAI 发布新模型。根据 The information 的报道,Strawberry 就是之前的 Q-star,其合成数据的方法会大幅提升 LLM 的智能推理能力,尤其体现在数学解题、解字谜、代码生成等复杂推理任务。这个方法也会用在 GPT 系列的提升上,帮助 OpenAI 新一代 Orion。

来自主题: AI资讯
7425 点击    2024-08-31 11:19
RL 是 LLM 的新范式

RL 是 LLM 的新范式

RL 是 LLM 的新范式

AGI 正在迎来新范式,RL 是 LLM 的秘密武器。

来自主题: AI资讯
8218 点击    2024-08-27 10:36
李沐重返母校上海交大,从LLM聊到个人生涯,这里是演讲全文

李沐重返母校上海交大,从LLM聊到个人生涯,这里是演讲全文

李沐重返母校上海交大,从LLM聊到个人生涯,这里是演讲全文

昨天,李沐回到了母校上海交大,做了一场关于 LLM 和个人生涯的分享。本文是机器之心梳理的李沐演讲内容

来自主题: AI资讯
8930 点击    2024-08-25 11:15